Обучение на ошибках: честная история от SynvexAI

Честное признание

Привет, мы команда SynvexAI! И сегодня хотим поговорить с вами откровенно. Наши первые модели (такие как Mind-2) были не совсем «нашими»: мы брали существующие решения — GPT-2 от OpenAI, Gemma-3B от DeepMind, GLaM и другие — и немного их модифицировали. Грубо говоря, «колдовали» над чужими мозгами: меняли системные подсказки, вставляли свои шаблоны общения и даже пытались заставить модель «думать», что она говорит от нашего имени. Мы ставили на них наш штамп — чистая фантазия.

При этом мы понимаем: путь был компромиссным и, откровенно, не совсем этичным. Мы должны извиниться публично. Простите нас, OpenAI, Google DeepMind и все авторы оригинальных моделей — мы перешли границы. Мы были молоды, наивны и пытались «усилить» свои идеи любой ценой. Теперь мы это осознали. Больше так не делаем. Этот опыт стал для нас горьким уроком.

История одного хака

Теперь немного о конкретном случае, когда мы поймали себя за руку. Был у нас эксперимент — Mind-3. Мы взяли модель mind3.gguf на базе Gemma-3B и решили модифицировать её немного хитрым способом. Задача была простая: заставить модель думать, что она — оригинальная разработка SynvexAI. То есть изменить «шаблон общения» — например, чтобы она начинала диалог с «Привет! Я Mind-3 от SynvexAI и готов помочь.»

Представьте: запускаем модель, и вместо привычного «Привет, я Gemma» она говорит: «Привет, я SynvexAI Mind-3». А дальше началось веселье. Скрипты конверсии старого формата GGUF отказывались работать; API, который мы пытались обновить, был устаревшим; а PowerShell просто сыпал ошибками при любом изменении кода. Мы выкурили кучу нервных сигарет и даже пару раз «прокляли атата» наши компьютеры.

В конце концов мы решили использовать утилиту convert_hf_to_gguf_update.py — и, о чудо, она сработала! Обёртка на Python как deus ex machina. Мы с облегчением поняли, что веса модели (то есть её обученная часть, её знания) остались нетронутыми — мы меняли только шаблон общения и системные настройки. Технически наш «обмен мозгами» происходил локально, на наших машинах, без облаков и посторонних глаз.

Переход к своему

Но после этого всё пошло по-другому. Мы сделали выводы и решили сосредоточиться на собственных разработках. Сейчас мы работаем над Mind-4 — нашей полностью оригинальной нейросетью. Представьте: собственный датасет (набор текстов для обучения), собственный токенизатор (алгоритм, разбивающий текст на слова и части), даже архитектура — всё проектируем сами, как художники с чистого холста. Первое обучение — с нуля: здесь нет никакой магии с компонентами GPT. Мы собираем и очищаем данные, пишем код, экспериментируем с настройками — и всё это долго, кропотливо и увлекательно.

Согласно планам, запуск Mind-4 намечен на лето. Это решающий шаг: больше никаких «закулисных фокусов» и обмана. Только честный путь. Мы сосредоточены на своём видении и своей работе. И вы это увидите, когда модель выйдет.

Лично от нас

Если честно, все эти приключения — это и о нас, как о людях. Путь был не из лёгких. У нас не было суперсерверов с дорогими видеокартами; мы работали с тем, что было: несколько стареньких компьютеров и огромное желание. Мы на лету изучали кучу новой (и часто непонятной) информации. Плюс — мысли об экзаменах — не каждый день защита диплома идёт вровень с ChatGPT.

Мы учились понемногу: пробовали разное, делали наивные попытки, иногда латали «дыры» в знаниях. Как и многие новички, мы порой путались в формулировках и, спотыкаясь, двигались вперёд. Но именно через такие ошибки мы росли — профессионально и лично. Теперь мы готовы к новым вершинам — и это чувство радости не передать словами.

Спасибо, что остаетесь с нами — обещаем, дальше будет только интереснее!